我在微软做研发 | 张冬梅:带领数据探索的梦之队
张冬梅 微软亚洲研究院首席研究员
丹棱君有话说:作为 D&I 文化(Diversity and Inclusion,多元与包容)的倡行者,微软一直支持女性员工释放潜能、施展才华。国际劳动妇女节就要到了,借此机会,丹棱君想把身边才华横溢的女同事介绍给大家,分享她们在科研上的突出成就,聊一聊在工作和生活中的那些事。
系列文章“我在微软做研发”第一篇,就从张冬梅博士的 13 年微软生涯开始吧!
13 年前,2004 年的那个夏天,张冬梅坐在回国的飞机上,思忖着即将到来的新生活,有着几分期许,也有几分兴奋。“回国前不知道会发生什么,会和什么人工作,很多东西都是未知的。”张冬梅如是说道。那时的她,正准备加入微软亚洲研究院。
光阴如白驹过隙,13 年后的今天,张冬梅已经成为微软亚洲研究院首席研究员,她带领的软件分析组(Software Analytics Group)成绩斐然。他们通过与微软 Power BI 产品组的合作,将“快速洞察”(Quick Insights)、“信息图设计”(Infographic Designer)等技术成功地转化到 Power BI 产品中。同时,两个团队下一步的合作更是为 Power BI 构建了良好的产品愿景,让该产品在商业智能(Business Intelligence,简称 BI)领域最权威的报告之一 —— Gartner 魔力象限(Magic Quadrant)2017 中身居领导者象限的高位,并在未来布局能力(Completeness of Vision)上一骑绝尘,领先所有厂商。
事实上,正是由于张冬梅博士带领的微软亚洲研究院软件分析组的研究,让微软在智能数据发现(Smart Data Discovery)这个前沿领域实现了从无到有,从“零”到“领”的突破。这项来自于研究院的前沿技术研究也为 Power BI 展示了清晰的未来布局方向。说起这个话题,张冬梅十分自豪。而令她更为骄傲的是她所带领的团队。这是由一群追求完美不知疲惫、对技术的热情多年来只增不减的研究员们所组成的“梦之队”。
做一个人人投入的项目,让所有人都能参与其中。
对于张冬梅博士所带领的软件分析组而言,研究工作涉及到多个领域以及它们的交叉和合作。
软件分析组以软件和系统在开发、运行、维护整个生命周期中的问题作为研究对象,研究课题主要围绕以下几个方面:一是软件系统的质量(Quality),如可靠性、性能、以及安全性等;二是用户体验(Experience),如用户界面、用户使用方式、以及用户黏度等;最后是软件的开发效率(Productivity)。软件分析是一个大数据分析、机器学习与软件系统学科相结合的交叉研究方向, 这就需要研究团队在大规模数据的存储与计算、数据挖掘、机器学习、软件学科以及信息可视化和人机交互等多个研究领域内有深厚的基础。
张冬梅博士说:“日常工作中,我们使用大数据分析、机器学习和信息可视化技术来解决软件系统和在线服务的生命周期中的各种问题;同时,这些在实际生产实践中遇到的问题与挑战也为我们在大数据、机器学习、软件学科等方面的基础算法和理论的研究提供问题和灵感。事实上,包括‘Quick Insights’在内,我们有很多研究课题与项目设想都是基于这种理论与实践相互作用的过程中产生的。”
一般情况下,研究组内会有多个项目同时展开,每个项目的规模不会太大。做一个人人投入的项目,把项目做到应有的规模,这是张冬梅一直酝酿着的一个想法。2014 年 11 月,随着 Quick Insights 项目(内部代号:IN4)的开始,她的想法逐渐成为现实。所谓 IN4,指的是 INteractive(互动)、INtuitive(直观)、INstant(瞬时)和 INsights(洞察),这也代表了这个项目的目标:打造出一种交互式、直观、快捷的分析数据获取洞察的方式,为用户提供全新的数据分析体验。
如今的大数据时代对数据分析产生了很高的需求,这种需求不仅仅局限在软件领域,各行各业都会有。虽然商业智能在过去几十年内实现了快速发展,市场上已经存在不少相关工具,但张冬梅团队发现了一个有趣的现象:在用户使用这些工具的过程中,用户总是处于主动的位置,而工具总是处于被动的位置。例如,工具只有在用户进行查询时,才会调取数据告知相应信息,再根据用户制表画图等要求进行相应操作。在这个过程中,工具本身并不会主动分析提取数据中的信息,并向用户进行展示和推荐。这样的发现让团队开始思考:为什么不能让这些工具更加智能,让工具在交互中根据用户的需求变得主动呢?
这是我们想要的效果么?
这样的展望让团队成员一拍即合,决定开启 IN4 项目。面对多维度、大规模的数据,如何让系统自动搜寻有趣的数据特征,即所谓的 insight(洞察),是团队在项目最初阶段面临的重多挑战之一。要解决这个问题,团队需要回答更多问题,比如说,什么是 insight?(需要一个严谨具体的定义)如何挖掘数据?(需要一套高效的算法)挖掘出 insight 后如何向用户表达呈现?如何用自然语言描述?这些具体问题让团队成员逐渐聚焦四大关键技术:Excel Magic(元数据理解),Auto Insights(insight 挖掘),MetroEyes(双向交互)和Power Story(insight 描述)。根据这些具体的技术需求,张冬梅将团队分为多个小组,大家同时开展研究。
因为 IN4 的研究目标是提供端到端的数据分析服务系统原型,所以针对任何一个要素,研究员都需要一边做技术研究,一边做工程设计。从 2014 年 11 月到 2015 年 3 月,这短短的 5 个月时间,对每个研究员来说都是一段紧张而难忘的时光。张冬梅尤其记得当时每周五组会,大家聚在一起汇报各小组进展。作为压轴节目,负责交互设计和系统集成的研究员侯志涛会将大家的成果汇总进行演示,那时大家最经常说的一句话就是:这是我们想要的效果么?如果答案是否定的,接下来就会是进一步的讨论、反馈和改进。周周如此,周而复始。
“这是我们能拥有的最好的合作伙伴之一”
时间快进到 5 个月后,2015 年 3 月。在微软总部举行的技术节(TechFest)上,软件分析组首次在公司内部展示 IN4。就在这场 R(Research 研究)与 D(Development 产品开发)的交流活动上,IN4 项目和 Power BI 首次相遇,并被 Power BI 产品团队一眼相中。时任 Power BI 工程总监的 Nick 特意改变行程与张冬梅的团队开会,并表示出强烈的合作意向:Power BI 需要这样的能力,让我们两个团队一起来完善它。
在微软技术节结束后的三个月内,双方的紧密合作促使项目进展迅速。7 月,IN4 的产品原型 Quick Insights 已经初见端倪。到了 12 月,Quick Insights 正式上线。在短短 9 个月的时间内,从实验室里的技术原型到能够被无数用户使用的正式产品,效率之高让人惊叹。
和传统的数据分析工具相比,Quick Insights 改变了用户与工具的交互模型,使工具在交互中变得主动。当用户上传数据之后,它的算法能够主动对这些数据进行分析,将分析结果以 insights 的形式进行组织和排序,并将排名在前的 insights 提供给用户。不仅如此,Quick Insights 会选择适合的可视化方式来呈现这些 insights,并配合文字说明以方便用户理解。在五个月之后,两个团队合作推出了第二个功能发布,增添了 contextual/scoped insight(特定范围内的洞察)的新功能,让系统可以针对已有图表和分析给用户推荐相关性更高的分析建议。
你们怎么总给我送来圣诞礼物?
微软亚洲研究院软件分析组与 Power BI 团队的合作不会止步于此,双方的合作过程也给予了张冬梅和团队源源不断的研究灵感。
2016 年 8 月,张冬梅团队和研究院创新工程组共同完成了为 Power BI 特别研究开发的“信息图设计”(Infographic Designer)技术。它可以将已有数据进行丰富多样的可视化呈现,用户可以通过精确控制形状、颜色和布局来控制列表、条形图和柱形图等具体外观,使得用户可以高度具象化地对数据进行描述和展示。这一技术也为 Power BI 填补了可视化功能的一项空白。
在 Infographic Designer 于 10 月底走向大众之后,张冬梅团队又为他们带来了另一个惊喜—— Anna Talk。这是一种通过自然语言对话进行交互的商业智能和数据分析工具。微软亚洲研究院院长洪小文博士在 2016 年“21 世纪的计算大会”的演讲中向与会者展示了 Anna Talk。
https://v.qq.com/txp/iframe/player.html?vid=j0377v2f5h1&width=500&height=375&auto=0
例如当用户上传了过去几年某地的啤酒销售数据,Anna Talk 会像一个经验丰富的人工智能分析师一样,主动提醒你关注去年 5 月份的销售异常数据,也会主动问询你是否需要调出过去几年内的 5 月销售数据作为对比。此外,Anna Talk 还能抛弃原有的搜索查询界面,转而使用自然的人机对话,你可以像与助理对话一样跟 Anna Talk 进行对话,让她帮你调出你想要的数据并自动生成报表。从原有的自然语言问询到对话,从被动回答到主动引导,从分立用户界面到无缝多模态界面, Anna Talk 将重新定义数据分析的体验。
张冬梅给 Power BI 团队展示了 Anna Talk,并得到了高度的好评。Anna Talk 为 Power BI 在自然语言与数据分析相结合的方向上提供了新的思路,被时任 Power BI 负责人的 Nick 称为“美好的圣诞礼物”。
这次交流再一次印证了张冬梅及其团队多年的坚持 —— 从实际问题中获得灵感,做最好的研究,走在产品应用的前面。研究者身上必须肩负着探索未来的责任与远见。而在微软,这种远见可以让研究成果更快落地,创造社会价值。
一切都离不开数据和分析
让人惊喜连连的张冬梅将这些成绩都归功于团队和大家始终如一和坚持不懈的努力。回想过去 13 年,张冬梅表示自己和团队这些年来工作的核心一直围绕着数据和分析。这种十几年如一日的坚持并不多见。值得欣慰的是,因为软件分析本身就是交叉学科,且团队从第一天开始就是横向纵向研究并重,这使他们的研究范围从不会禁锢于某个范围,而是发散性的、可延伸的。这种坚持也让团队在数据分析领域积累深厚,视野开阔,能够厚积薄发,开发出 Quick Insights、Infographic Designer 等极富前瞻性又具有实际应用性的项目。
张冬梅及其团队
自 2004 年从微软总部加入微软亚洲研究院至今,张冬梅已经在这里度过了 13 个春秋,和组内同事也早已亲如家人一般。谈到团队,张冬梅满满的骄傲。软件分析组内的研究员有着多元的技术背景,这让大家可以集思广益,优势互补。同时,团队里的每一个人都有着对科研孜孜不倦的热情与追求,不知疲倦,这也让张冬梅作为一个女性领导者备受鼓舞。回想 13 年前在飞机上思考未知生活的自己,张冬梅笑了,她觉得自己很幸运,能够加入这样一个团队,和这样一群满怀激情的人一起努力,一起创造。面向未来,她也充满希望,期待着更多的探索和挑战。我们也期待着她和她的团队在未来给大家带来更多的惊喜。
本文转载自微信公众号:微软研究院 AI 头条
了解更多:
后台入驻微软小冰
如果你很萌,请跟她一决高下!